A transição do NVIDIA GT200 para o arquitetura Fermi representa o nascimento da terceira geração de computação de GPU. Enquanto arquiteturas anteriores eram unidades voltadas para gráficos "adaptadas" para cálculos matemáticos, o Fermi foi projetado do zero para GPGPU (GPU de Propósito Geral) aplicações.
1. Do Primeiro Gráfico para o Primeiro Computacional
Diferentemente do GT200, que se concentrava em unidades de textura e paralelismo rígido de dados, o Fermi introduziu um caminho unificado de solicitação de memória. Essa mudança permitiu Pensamento Computacional, permitindo que desenvolvedores ultrapassem mapeamentos simples em grade 2D rumo a algoritmos C++ complexos.
2. O Salto na Hierarquia de Memória
O Fermi introduziu uma verdadeira hierarquia de cache L1/L2 e conformidade com IEEE 754-2008 padrões de ponto flutuante. Isso significou que pesquisadores já não precisavam gerenciar manualmente a memória "scratchpad" (memória compartilhada) para cada byte, permitindo estruturas de dados irregulares e precisão em dupla precisão adequada para engenharia científica.